1.专业定位
数据科学与大数据技术是近几年兴起的一个跨学科领域,与统计、数学、计算机科学相关理论体系融合,解决在数据规模大、传输速度快、多源异构特征显著等条件下的数据管理、数据分析、数据应用问题。其研究内容是从各种结构化或非结构化的数据中抽取知识或见解的过程或系统,致力于将大数据分析作为核心轴线。统计学、数学、计算机科学为三大基础支撑学科。
信息技术与经济的交汇融合引发了数据的迅猛增长,数据不仅是科学与技术研究的对象,而且已成为国家基础性战略资源,大数据正日益对全球生产、流通、分配、消费活动以及经济运行机制、社会生活方式和国家治理能力产生重要影响。人们对数据处理与分析的需求日益增长。
近年来,广州市将大数据应用纳入战略新兴产业、科技和创新发展、工业和信息化发展等专项资金的重点支持领域。为了建立“用数据说话、用数据决策、用数据管理、用数据创新”的管理机制,提升政府经济管理和社会治理能力,促进大数据产业的创新发展,推动广州市经济发展动力转换、结构优化和转型升级,需要大量胜任数据分析、数据挖掘和大数据系统开发的研究型和技术型专门人才。本专业是广州市高等教育适应经济和社会发展对人才需求的具体表现,将为广州市乃至广东省培养大量适应数字经济建设所需要的大数据管理、分析及应用专门人才,为将广州建成具有国际竞争力的国家大数据强市而努力奋斗!
2.培养目标及特色
根据党的教育方针和学校24字育人理念,本专业培养德、智、体、美、劳全面发展,具有良好的政治素养和道德素养,掌握扎实数据科学的基础知识、理论及技术,包括面向大数据应用的统计、机器学习、数据可视化等学科基础知识和数据预处理、数据统计、机器学习、数据可视化、数据计算、数据管理的基本理论、基本方法和基本技能,具有一定的大数据科学研究能力及数据科学家岗位的基本能力与素质,富有创新精神、实践能力和国际视野,能够解决行业领域数据密集型应用的复合型人才。学生毕业后,适合于在国内外相关专业深造,或在各政府部门、企事业单位、跨国公司、信息咨询公司等从事海量数据管理、分析及利用大数据方法解决具体商务领域、行业应用问题。
本专业属于统计学、计算机科学与数学三大学科交叉形成的大数据人工智能时代社会所急需的本科专业,聚焦大数据管理、分析及应用人才的培养。基于OBE理念和新工科理念,教学以学生全面发展为中心、以能力为中心,以产出为导向,促进学生全面发展。本专业特别强调学生动手能力的培养,以培养创新人才为导向,共享协同育人模式,坚持“厚基础、强实践、精技能、重创新”的培养模式,建设创新型集“学、研、训、产”四位一体的具有国内一流水平的人才培养新机制。
3.培养规格
(1)学制、学分要求
本专业基本学制四年,允许在三到七年的弹性学制内完成学业。各层次课程应满足相应的毕业学分要求。
(2)素质要求
1)思想道德素质:热爱祖国,拥护中国共产党领导,具有高尚的道德品质、科学思想和人文素养,有为国家富强、民族昌盛而奋斗的责任感,做到责任担当、贡献国家、服务社会。
2)专业素质:具有严谨的科学态度,具备良好的团队协作精神和国际化视野。
3)身心素质:保持心理健康,乐观豁达,积极向上,养成锻炼身体的良好习惯,达到《国家学生体质健康标准》,具有健康的体魄,能够承担建设祖国的任务。
(3)知识要求
1)人文社科知识:具有一定的人文社会科学知识和素养,掌握必要的哲学、经济学、法律等方面的知识,在文学、艺术、伦理、历史、社会学及公共关系学等方面有一定的修养。
2)自然科学知识:具有较为扎实的自然科学基础理论,掌握数学、统计和计算机等学科基础理论和知识,为专业基础课和专业课的学习打下坚实基础。
3)专业知识:系统掌握数据科学的基础知识、理论及技术,包括面向大数据应用的统计、机器学习、数据可视化等学科基础知识和数据预处理、数据统计、机器学习、数据可视化、数据计算、数据管理的基本理论、基本方法和基本技能。
(4)能力要求
1)信息获取能力:能够开发、选择与使用恰当的技术、资源、现代信息技术工具查询资料、获取信息、拓展知识领域、继续学习提高水平的能力。
2)交流与表达能力:具有应用语言、图表和计算机技术等进行沟通和交流的基本能力;能够就复杂工程问题与业界同行及社会公众进行有效沟通和交流;具有一定的国际视野,能够在跨文化背景下进行沟通和交流。
3)研究与管理能力:能够基于科学原理并采用科学方法对复杂问题进行研究,包括设计实验、分析与解释数据、并通过信息综合得到合理有效的结论。
4)创新与终身学习能力:掌握基本创新方法,具有追求创新态度和意识;初步具有科学研究、技术开发的能力;具有自主学习和终身学习的意识,有不断学习和适应发展的能力。
4.课程体系
(1)总体框架:专业课程体系包括学科基础课程、专业必修课程和专业选修课程。
(2)核心课程:数学分析、几何与代数、数据库技术及应用、Python程序设计、最优理论与算法、云计算技术、数据工程、机器学习、神经网络与深度学习、分布式统计算、数据可视化等。
(3)实践教学:认识实习开展一周时间。大数据实训包括三阶段:第一阶段主要是编程实践;第二阶段主要是数据挖掘与机器学习;第三阶段主要是大数据平台技术实践。毕业实习开展3周时间。
5.师资队伍
数据科学与大数据技术相关学科现有专任教师及教辅人员共计17人,其中教授3人,副教授8人,其中博士生导师3人,90%的教师具有博士学位。全部教师学科背景主要集中在人工智能、数据科学、统计学、应用数学等。近年来,广州大学全面推进高水平大学建设,引进了大量具有国际视野的高层次人才,同时,也通过在职培养、进修等形式对在职教师进行培养。现在,广州大学已经具备一支具备高学历层次、职称结构合理、年龄和专业分布合理的数据科学与大数据技术专业教师队伍和教辅队伍。
6.教学条件
(1)教学用房有保障
学校教学行政用房总面积525036平方米,全日制在校生均面积15.48平方米。
(2)图书资料丰富
广州大学图书馆文献资源内容丰富,种类齐全,结构合理,有各类印刷型文献2,985,000册,中外文数据库103个,中外文电子图书112万种,电子期刊22100种。目前,数据科学与大数据技术专业专业图书资料丰富。数据科学与大数据技术及其相关专业中文图书藏书量有5万册,外文藏书量为0.2万册;与数据科学与大数据技术相关的外文期刊有5种,中文期刊10余种。同时,学校电子图书馆与本专业的图书多达8万多册,与本专业相关的电子期刊达70余种。
(3)实验室
广州大学一贯重视学生的创新精神和实践能力的培养,在实践教学、教学设施等方面了大量的人力、物力。本专业配备了数据科学实验室。数据科学实验室面积约为130平米。实验室设备包括学生计算机85套和教师计算机1套;实验室控制计算机4套;投影机1部,路由器1台;交换机4台。此外还在实验室配备了四路视频、音频分配器、复合机、投影幕、数码摄像机等仪器设备。
数据科学实验室搭建了CourseGrading一体化教学平台(以下简称CG平台)对数据科学与大数据技术专业的支撑架构图如图所示。
图1 大数据教学与在线实验平台功能架构
从图可以看出,CG教学平台提供了基本的功能支撑和教学支撑,支撑本专业各课程的教学与实践,实现在线资源的统一管理。一体化平台具备基本的课程管理功能,这些功能包括但不限于:公告管理,课程信息管理,学生管理,题库管理,在线作业,在线考试,作业成绩分析,考试成绩分析,成绩汇总,在线答疑,权限管理,助教管理,MOOC功能。具体包括以下几方面:
1)完善的课程管理平台。
2)全方位支持在线考试。
3)支持代码相似性比较和文档相似性比较。
4)支持代码自动评判。
5)在线虚拟实验环境。
6)支持自建在线实验。
7)教育大数据沉淀。
本专业实验室面积和装备能满足学生独立进行实验的要求,实验开出率达到100%。实验室向学生开放,教学效果良好。总之,本专业教学实验室配备较完善,设备先进,利用率高,在专业人才培养中发挥了较好的作用。
(4)实习基地
校内可充分利用现有实验室,将实验室兼做实习实训的校内基地。在校外实习实训基地的建设方面,目前本专业已有1个校级培训中心和十多个签约实习基地,签约的实习基地大多都分布在广州、深圳地区。签约的校外实习、实训基地都是经过精挑细选,具有较高的综合素质。